”复旦 文本分类 语料 文本分类语料“ 的搜索结果

     本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。(使用时尽量注明...

     文本分类语料库(复旦)的测试语料库是一个被压缩成rar格式的文件,主要用于文本分类任务的测试和评估。该语料库由复旦大学计算机科学与技术学院提供。 train.rar文件包含了大量的文本样本,这些样本已经被预处理和...

     文本挖掘与文本分类的概念 文本挖掘(Text Mining)是从一个非机构化文本信息中获取用户感兴趣或者有用的模式过程。文本挖掘的 7 个主要领域如下: 搜索和信息检索:存储和文本文档的检索,包括搜索引擎和文档的...

     这是我通过改进他人的算法,对中文复旦大学语料库的文本做文本分类的项目。 也是我第一次独立进行中文文本分析的小DEMO。 项目源码在这里: https://github.com/yingdajun/ML_Text_Classifiaction

10  
9  
8  
7  
6  
5  
4  
3  
2  
1